optické rozpoznávání znaků (OCR), je překlad opticky naskenované rastry tištěných nebo psaných znaků textu do znakové kódy, jako je například ASCII. Je to efektivní způsob, jak proměnit v tištěné podobě materiálů do datových souborů, které lze upravovat a jinak upraveny pomocí počítače. To je technologie dlouho používají v knihovnách a vládních agentur, aby dlouhé dokumenty rychle k dispozici v elektronické podobě. Pokroky v technologii OCR uspíšily jeho rostoucí využití ze strany podniků. Pro mnoho dokumentů vstupních úkolů, OCR je nejvíce nákladově efektivní a rychlý způsob k dispozici. A každý rok, technologie uvolní akrů úložného prostoru jednou předána do skříně a krabice plné papírových dokumentů souborů. Předtím, než OCR může být použita, musí být zdrojový materiál kontrolovány pomocí optického skeneru (a někdy specializovaný obvodové desce v PC), si můžete přečíst na stránce jako bitmapu (vzor teček). Je rovněž nutné Software rozpoznat obrázky.
Náš software balíček navrhuje řešit klasifikace izolovaných ručně psaných znaků a číslic z UJI Pen znaky Soubor dat pomocí neuronových sítí. Dat se skládá ze vzorků 26 znaků a 10 číslic napsaných 11 spisovateli na tablet PC. Postavy (ve standardním formátu UNIPEN) jsou psány jak v malých a velkých písmen a tam je celá dvě sady znaků na spisovatele. Takže výstup by měl být v jednom z 35 tříd. Konečným cílem je vybudování spisovatel nezávislý model pro každou postavu.
Výběr hodnotných vlastností je zásadní rozpoznávání znaků, a proto nový a smysluplný sadu funkcí, Uniform Differential normalizovaných souřadnic (UDNC), zavedla C. Agell, je přijat. Tyto funkce jsou zobrazeny na zlepšení rychlosti rozpoznávání pomocí jednoduchého třídění algoritmy, takže jsou zvyklí trénovat neuronovou sítí a otestovat jeho výkon na UJI Pen znaky Soubor dat.
Všeobecné:. Matlab, zdrojový kód, OCR, optické rozpoznávání znaků, naskenovaný text, psaný text ASCII, izolovaných znaků
Požadavky na :
Matlab
Komentáře nebyl nalezen